智能论文笔记

Large-Scale Hate Speech Detection with Cross-Domain Transfer

Cagri Toraman , Furkan Şahinuç , Eyup Halit Yilmaz

分类：自然语言处理

2022-03-02

仇恨言语检测模型的性能取决于对模型的训练数据集。现有的数据集大部分是由有限数量的实例或定义仇恨主题的仇恨域准备的。这阻碍了关于仇恨领域的大规模分析和转移学习。在这项研究中，我们构建了大规模的推文数据集，以用英语和低资源语言（土耳其语）进行仇恨言论检测，每个人都由每个标签的100k推文组成。我们的数据集设计为在五个域上分布的推文数量相等。统计测试支持的实验结果表明，基于变压器的语言模型的表现优于传统词袋和神经模型的英语至少5％，而土耳其语则优于大规模仇恨言语检测。该性能也可扩展到不同的训练规模，在使用20％的培训实例时，将回收98％的英语表现和土耳其语的97％。我们进一步研究了仇恨领域之间跨域转移的概括能力。我们表明，其他英语域平均有96％的目标域性能恢复，而土耳其语为92％。性别和宗教更成功地概括到其他领域，而体育运动最大。

translated by 谷歌翻译

Pre-Training With Scientific Text Improves Educational Question Generation

Hamze Muse , Sahan Bulathwela , Emine Yilmaz

分类：自然语言处理 | 人工智能 | 机器学习 | (统计)机器学习

2022-12-07

With the boom of digital educational materials and scalable e-learning systems, the potential for realising AI-assisted personalised learning has skyrocketed. In this landscape, the automatic generation of educational questions will play a key role, enabling scalable self-assessment when a global population is manoeuvring their personalised learning journeys. We develop EduQG, a novel educational question generation model built by adapting a large language model. Our initial experiments demonstrate that EduQG can produce superior educational questions by pre-training on scientific text.

translated by 谷歌翻译

Fine-grained Classification of Solder Joints with α-skew Jensen-Shannon Divergence

Furkan Ulger , Seniha Esen Yuksel , Atila Yilmaz , Dincer Gokcen

分类：计算机视觉

2022-09-20

焊接联合检查（SJI）是生产印刷电路板（PCB）的关键过程。在SJI期间发现焊料错误非常具有挑战性，因为焊接接头的尺寸很小，并且可能需要各种形状。在这项研究中，我们首先表明焊料的特征多样性低，并且可以作为精细颗粒的图像分类任务执行SJI，该任务侧重于难以固定的对象类。为了提高细粒度的分类精度，发现通过最大化熵来惩罚自信模型预测，在文献中很有用。与此信息内联，我们建议使用{\ alpha} -skew Jensen-Shannon Divergence（{\ alpha} -js）来惩罚模型预测的信心。我们将{\ alpha} -js正则化与现有基于熵指定的方法和基于注意机制，分割技术，变压器模型和特定损耗函数的方法进行比较。我们表明，在细化的焊料联合分类任务中，所提出的方法可以达到不同模型的F1得分和竞争精度。最后，我们可视化激活图，并表明，凭借熵的规范化，更精确的类歧视区域是局部的，这也更适合噪声。接受代码将在这里接受。

translated by 谷歌翻译

A Gis Aided Approach for Geolocalizing an Unmanned Aerial System Using Deep Learning

Jianli Wei , Deniz Karakay , Alper Yilmaz

分类：计算机视觉

2022-08-25

全球定位系统（GPS）已成为我们日常生活的一部分，其主要目标是提供地理位置服务。对于无人驾驶系统（UAS），地理定位能力是极为重要的必要性，使用惯性导航系统（INS）伴随着GPS的心脏而实现。没有地理位置服务，UAS将无法飞往目的地或回家。不幸的是，GPS信号可能会被堵塞，并在Urban Canyons中遇到多路径问题。我们的目标是提出一种替代方法，以降级或拒绝GPS信号时地理位置化UA。考虑到UAS在其平台上具有下降摄像头，可以在平台飞行时获得实时图像，因此我们将现代深度学习技术应用于地理定位。特别是，我们执行图像匹配，以在UAS获得的图像和卫星正尾之间建立潜在特征共轭物。特征匹配的典型应用遭受高层建筑物和该领域的新结构的影响，这些建筑物将不确定性引入同型估算中，因此导致地理定位性能差。取而代之的是，我们将GIS信息从OpenStreetMap（OSM）提取到语义段匹配的功能中，以纳入建筑物和地形类。 GIS掩码在选择语义匹配的功能时可以作为过滤器，从而增强了Coplanarity条件和UAS地理定位精度。发表论文后，我们的代码将在https://github.com/osupcvlab/ubiheredrone2021上公开获得。

translated by 谷歌翻译

HTML版本

UAS Navigation in the Real World Using Visual Observation

Yuci Han , Jianli Wei , Alper Yilmaz

分类：机器人 | 计算机视觉

2022-08-25

本文介绍了一种新颖的端到端无人空中系统（UAS）导航方法，用于现实世界中的远程视觉导航。受到人类本能的双过程视觉导航系统的启发：环境理解和地标识别，我们将UAS导航任务分为两个相同的阶段。我们的系统结合了增强学习（RL）和图像匹配方法。首先，代理在指定环境中使用RL学习导航策略。为了实现这一目标，我们为培训过程设计了一个交互式的UASNAV环境。一旦代理商学习了导航政策，这意味着“熟悉环境”，我们就让UAS在现实世界中飞行，以使用图像匹配方法识别地标，并根据知识渊博的政策采取行动。在导航过程中，UAS嵌入单个相机作为唯一的视觉传感器。我们证明，UAS可以学习在现实世界中最短的道路上距离起点几百米的目的地。

translated by 谷歌翻译

HTML版本

How important are socioeconomic factors for hurricane performance of power systems? An analysis of disparities through machine learning

Alexys Herleym Rodríguez Avellaneda , Abdollah Shafieezadeh , Alper Yilmaz

分类：机器学习

2022-08-18

本文研究了社会经济因素是否对于佛罗里达电力系统的飓风表现很重要。使用随机森林分类器进行调查，其准确性平均降低（MDA），以衡量一组因素的重要性，包括危害强度，最大影响时间恢复时间以及受影响人群的社会经济特征。这项研究的数据集（在县规模上）包括来自美国5年社区调查（ACS）的社会经济变量，风速以及五次飓风的停电数据，包括2018年Alberto和Michael，2019年，Dorian，Dorian，Dorian，以及ETA和ISAIA在2020年。研究表明，社会经济变量对系统性能模型非常重要。这表明在发生停电的发生中可能存在社会差异，这直接影响了社区的弹性，因此需要立即关注。

translated by 谷歌翻译

Where is VALDO? VAscular Lesions Detection and segmentatiOn challenge at MICCAI 2021

Carole H. Sudre , Kimberlin Van Wijnen , Florian Dubost , Hieab Adams , David Atkinson , Frederik Barkhof , Mahlet A. Birhanu , Esther E. Bron , Robin Camarasa , Nish Chaturvedi

分类：计算机视觉 | 人工智能

2022-08-15

脑小血管疾病的成像标记提供了有关脑部健康的宝贵信息，但是它们的手动评估既耗时又受到实质性内部和间际变异性的阻碍。自动化评级可能受益于生物医学研究以及临床评估，但是现有算法的诊断可靠性尚不清楚。在这里，我们介绍了\ textIt {血管病变检测和分割}（\ textit {v textit {where valdo？}）挑战，该挑战是在国际医学图像计算和计算机辅助干预措施（MICCAI）的卫星事件中运行的挑战（MICCAI） 2021.这一挑战旨在促进大脑小血管疾病的小而稀疏成像标记的自动检测和分割方法的开发，即周围空间扩大（EPVS）（任务1），脑微粒（任务2）和预先塑造的鞋类血管起源（任务3），同时利用弱和嘈杂的标签。总体而言，有12个团队参与了针对一个或多个任务的解决方案的挑战（任务1 -EPVS 4，任务2 -Microbleeds的9个，任务3 -lacunes的6个）。多方数据都用于培训和评估。结果表明，整个团队和跨任务的性能都有很大的差异，对于任务1- EPV和任务2-微型微型且对任务3 -lacunes尚无实际的结果，其结果尤其有望。它还强调了可能阻止个人级别使用的情况的性能不一致，同时仍证明在人群层面上有用。

translated by 谷歌翻译

FIGO: Enhanced Fingerprint Identification Approach Using GAN and One Shot Learning Techniques

Ibrahim Yilmaz

分类：计算机视觉 | 人工智能

2022-08-11

指纹证据在识别个人的刑事调查中起着重要作用。尽管已经提出了各种指纹分类和特征提取的技术，但指纹的自动指纹识别仍处于最早的阶段。传统\ textIt {自动指纹识别系统}（AFIS）的性能取决于有效的小小的点，并且仍然需要人类的专家协助在功能提取和识别阶段。基于这种动机，我们提出了一种基于生成对抗网络和一声学习技术（FIGO）的指纹识别方法。我们的解决方案包含两个组件：指纹增强层和指纹识别层。首先，我们提出了一个PIX2PIX模型，将低质量的指纹图像转换为直接在指纹增强层中的Pixel的高水平的指纹图像像素。通过提出的增强算法，指纹识别模型的性能得到了显着提高。此外，我们通过观察指纹设备的识别精度来开发基于Gabor过滤器的另一种现有解决方案，作为与建议模型进行比较的基准。实验结果表明，我们提出的PIX2PIX模型比指纹识别的基线方法具有更好的支持。其次，我们使用单次学习方法在指纹识别过程中构建一个完全自动化的指纹特征提取模型。两个具有共享权重和参数的双卷积神经网络（CNN）用于在此过程中获得特征向量。使用提出的方法，我们证明只能以高精度从一个培训样本中学习必要的信息。

translated by 谷歌翻译

A coherence parameter characterizing generative compressed sensing with Fourier measurements

Aaron Berk , Simone Brugiapaglia , Babhru Joshi , Yaniv Plan , Matthew Scott , Özgür Yilmaz

分类：机器学习 | (统计)机器学习

2022-07-19

在Bora等。（2017年），在测量矩阵为高斯，信号结构是生成神经网络（GNN）的范围的设置中开发了一个数学框架，用于压缩传感保证。此后，当测量矩阵和/或网络权重遵循Subgaussian分布时，对GNNS进行压缩感测的问题进行了广泛的分析。我们超越了高斯的假设，以通过在单一基质的随机行中均匀地采样（包括作为特殊情况下的亚采样傅立叶测量值）来得出的测量矩阵。具体而言，我们证明了使用亚次采样的二型限制感测的第一个已知的限制等轴测保证，并提供了几乎有序的样品复杂性的恢复边界，解决了Scarlett等人的开放问题。（2022，第10页）。恢复功效的特征是连贯性，这是一个新参数，该参数测量了网络范围与测量矩阵之间的相互作用。我们的方法依赖于子空间计数论点和思想的核心概率。此外，我们提出了一种正规化策略，以使GNN与测量运算符具有有利的连贯性。我们提供令人信服的数值模拟来支持这种正规训练策略：我们的策略产生低相干网络，需要更少的信号回收测量。这与我们的理论结果一起支持连贯性作为自然量，用于表征与亚次采样的生成压缩感测。

translated by 谷歌翻译

Troll Tweet Detection Using Contextualized Word Representations

Seyhmus Yilmaz , Sultan Zavrak

分类：自然语言处理 | 人工智能

2022-07-17

近年来，已经出现了许多巨魔帐户来操纵社交媒体的意见。对于社交网络平台而言，检测和消除巨魔是一个关键问题，因为企业，滥用者和民族国家赞助的巨魔农场使用虚假和自动化的帐户。 NLP技术用于从社交网络文本中提取数据，例如Twitter推文。在许多文本处理应用程序中，诸如BERT之类的单词嵌入表示方法的执行效果要好于先前的NLP技术，从而为各种任务提供了新颖的突破，以精确理解和分类社交网络工作信息。本文实施并比较了九个基于深度学习的巨魔推文检测体系结构，每个bert，elmo和手套词嵌入模型的三个模型。精度，召回，F1分数，AUC和分类精度用于评估每个体系结构。从实验结果中，大多数使用BERT模型的架构改进了巨魔推文检测。具有GRU分类器的基于自定义的基于ELMO的体系结构具有检测巨魔消息的最高AUC。所提出的体系结构可以由各种基于社会的系统用于未来检测巨魔消息。

translated by 谷歌翻译